#Google DeepMind
FORTUNE雜誌─DeepMind創始人的豪賭:攻克一切疾病
八歲那年,德米斯·哈薩比斯只能依稀瞥見星辰。德米斯·哈薩比斯坐在位於倫敦大學學院天文台的弗萊望遠鏡前。圖片來源:Jillian Edelstein for Fortune這個天賦驚人的孩子成長於20世紀80年代的北倫敦,父母是頗具波西米亞氣質的文藝青年。透過城市朦朧的光靄,哈薩比斯偶爾能夠辨認出一個星座——獵戶座。它得名於希臘神話中那位驍勇的獵人,千百年來一直是水手與農夫的星空路標。四十年後的今天,獵戶座依然是他最愛的星群。這份眷戀,部分源於其與不朽傳說的連結:早在古埃及時期,人們就已經將這片星空奉若神明。“首先,從地球仰望星空,我們看到的星辰圖案其實具有某種隨機性。”哈薩比斯說道,“其次,以獵戶座腰帶上的三顆星為例,它們只是恰好構成特定幾何關係的恆星,之所以產生意義,完全是因為我們在用人類的意識解讀這些恆星。”我與哈薩比斯的會面地點,距離他成長的地方不遠,就在倫敦大學學院天文台的旁邊,矗立在那裡的望遠鏡已逾百年,至今仍然昂首指向蒼穹。這樣的場所恰好適合談論“浩瀚”:不止是星辰的浩渺無垠,更是人類心智的遼闊深邃。在此地對話,還有另外一層深意:哈薩比斯正是那位以人類意識探索資料海洋的先鋒。身為DeepMind聯合創始人,他被譽為當代最重要的人工智慧研究者與企業家之一。這家開創性的人工智慧實驗室於2014年被Google收購。2016年,DeepMind研發的AlphaGo擊敗全球頭號圍棋高手,造就人工智慧發展史上的里程碑事件——要知道,圍棋可是世界上最複雜的雙人策略博弈之一。如今,作為Google核心人工智慧業務的掌舵者,哈薩比斯正在引領這艘科技巨輪依託Gemini 3模型的優勢在激烈的競爭中破浪前行。但他迄今為止最深遠的貢獻,或許是AlphaFold 2的突破。這款由DeepMind於2020年發佈的人工智慧系統,可以根據DNA序列精準預測蛋白質的三維結構。AlphaFold 2堪稱一項劃時代的科學壯舉,為人類深入理解乃至最終攻克帕金森病、肌營養不良症及某些癌症等疾病打開了全新可能,這些疾病的根源均與蛋白質的錯誤折疊或功能失常密切相關。憑藉這一開創性成果,哈薩比斯與DeepMind的科學家約翰·江珀共同摘得2024年諾貝爾化學獎桂冠;同年,哈薩比斯獲授爵士勳銜。在哈薩比斯看來,過往的一切皆彼此相連。自幼對星空的痴迷,如同一道隱線,引領他探索人工智慧,在看似無序的世界中尋找規律與意義。“夜空是一道始終凝視我們的永恆謎題。”他說,“它時刻提醒著我們,世間還有更宏大的命題需要思考,正是這片無垠將我引入‘浩瀚’之境。在那裡,你必須從海量的資料中捕捉規律,或在無窮的可能性裡,覓得關鍵的一步。”近年來,哈薩比斯將他每周100小時工作時間中的相當一部分,傾注於破解世界級模式識別難題——藥物發現。2021年,在Google母公司Alphabet的支援下,他創立了Isomorphic Labs。這家基於人工智慧的藥物設計公司,致力於為一些最“不可成藥”的疾病開發突破性療法。該公司的宣言樹立了一個近乎壯烈的宏大目標:要“攻克一切疾病”。自創立以來,Isomorphic Labs一直低調前行,至今未將任何藥物推進至決定性的臨床試驗階段。但近期的動向表明,這一里程碑已經不再遙遠。支持者認為,一旦投入實戰,其技術路徑將展現獨特優勢。近日,這家新創企業首次向《財富》雜誌敞開大門;記者與多位公司高管與科學家悉心探討的議題,堪稱人工智慧領域最大機遇與挑戰。“一家傳統的生物科技公司窮盡整個生命周期,或許只能推出一兩種新藥。”哈薩比斯指出,“而我們正試圖建構一套完整的系統、流程和技術體系,目標是每年開發數十種藥物。聽起來有些不可思議,但我相信,在未來的10年到20年內,如果能夠建立起一套猶如從乾草堆中尋針的流程,終將找到攻克所有疾病的路徑。”藥物發現,實則更像是在廣袤的艾奧瓦州尋覓一根針:這是一個將具有潛在治療價值的化合物置於無限生物學變數中測試的征程,挫折接連不斷,失敗率之高近乎令人絕望。儘管AlphaFold僅僅觸及這個宏大處理程序的一隅,它卻為打破既有困境帶來了希望。AlphaFold證明,人工智慧有望將動輒數年的生物醫學探索壓縮至分秒之間。基於此,哈薩比斯的構想清晰而深刻:若能以AlphaFold為基石,建構一個完整的藥物設計引擎,未來將會怎樣?這家應運而生的企業志在挑戰眾多同行折戟的領域,其突圍之道在於聚焦結構解析:通過人工智慧對藥物與靶點的相互作用進行分子層面的精準預測,從而大幅削減藥物發現臨床前階段慣有的漫長試錯過程。自獨立營運以來,Isomorphic Labs最初被歸為Alphabet“其他押注”類股,獲得資金支援。2025年3月,公司又完成了6億美元的A輪融資,由約書亞·庫什納的Thrive Capital領投,Google風投繼續跟投。這場豪賭的願景是:假以時日,人類將憑藉技術驅動的新型流程,設計出能夠治癒癌症、阿爾茨海默病等頑疾的藥物,並使這些如今看似如魔法般精密的工藝,最終成為行業標準。“如今,沒有人會考慮手工設計飛機,也不會有人願意乘坐手工設計的飛機。”Thrive Capital的合夥人文斯·漢克斯表示,“但現有的所有藥物依然是以這種方式設計的。展望未來,藥物研發應該像目前設計飛機那樣,依託強大的軟體、智能系統和模擬模擬來進行。”Isomorphic Labs的300餘名科研人員正在朝著這一目標全力進發,而哈薩比斯正是他們的領航員。極端渺茫的勝算可成藥化合物的潛在數量高達約1060種,規模遠超可觀測宇宙中的星辰。而這還僅僅涵蓋類藥小分子,實際數值可能更為龐大。識別出那些組合能夠抑制腫瘤或矯正危險突變,正是哈薩比斯和同行希望借助人工智慧破解的難題。縱觀人類歷史,藥物始終寥寥無幾,其中許多甚至源於偶然,如青黴素的發現源於黴菌污染。直到20世紀60年代,隨著早期抗癌藥與心血管藥物的出現,藥物發現處理程序才逐漸加速。但幾乎在整個20世紀,科學家們仍然依靠近乎蠻力的試錯與緩慢迭代的技術,在浩渺的化學宇宙中艱難探索。無數化學家終其一生埋頭於沸騰的漿液、重複的實驗、一次次推倒重來,卻大多以失敗告終。即便是在今天,每20位從事藥物發現的化學家中,通常僅有一人可以在職業生涯中成功推動一款新藥上市。“我們需要將各種不同的參數融合到一個分子中,使其完美匹配特定病症。”Isomorphic Labs的首席科學官邁爾斯·康格里夫解釋道,“有時你可能找到理想的靶點,合成了高活性化合物,初期效果顯著,其他方面卻不盡如人意,最終走入死胡同。這有點像打地鼠遊戲,一個問題解決了,另一個又冒出來。”康格里夫是行業內的佼佼者,他已經助力三款抗癌藥物成功上市,其中包括諾華與Astex Pharmaceuticals聯合開發的乳腺癌治療藥物瑞波西利。放眼整個行業,即使僅將一款藥物推進至臨床試驗階段,也經常被視為重大突破。但他指出,即使進入臨床試驗,失敗率依然高達90%。諾華的生物醫學研究總裁菲奧娜·馬歇爾對此深表贊同:“找到完美分子的機率微乎其微。”正是這種極低的成功機率,凸顯了AlphaFold 2的價值,也幫助Isomorphic Labs匯聚眾多頂尖人才。計算生物學總監梅麗莎·戴維斯坦言,她正是因為對AlphaFold技術的拓展應用深感著迷而加入團隊的。“過去,科研人員可能只為結晶一個膜蛋白窮盡職業生涯。”戴維斯指出,“但如今,任何科學家都可以輕鬆生成一個蛋白質結構。”其他高管與哈薩比斯的合作淵源則更為深厚。目前,Isomorphic Labs約11%的員工來自DeepMind,包括現任總裁馬克斯·賈德伯格。他此前在DeepMind工作七年,其間主導開發了AlphaStar,這是首個在電子遊戲《星海爭霸II》中擊敗人類職業選手的人工智慧系統。“每當聽說有藥物化學家終其一生都未能成功研發出一款新藥,總是令人深感敬畏。”賈德伯格感慨萬千。“這與我在人工智慧領域的經歷截然不同——在那裡,你必須每六個月就突破世界頂級水平,否則就會被淘汰。”他補充道,“當理論照進現實,面對實實在在的科學流程與動手操作的實驗工作,那種敬畏感會變得無比真切。”鑑於哈薩比斯密集的行程,他在Isomorphic Labs的時間非常有限,因此招攬頂尖人才成為他的要務之一。他每周僅有一天(通常是周二)會前往這家新創企業的辦公室,與高管團隊會面,並為公司的技術方向確定優先事項。哈薩比斯特別看重人才的創造力,他曾經笑言,自己熱衷於管理那些“需要精心呵護的天才”。哈薩比斯指出,“任何專業科學家在技術層面都已經極為出色,但能否提出具有創造性的新思路,或精準地提出關鍵問題?這其實更為困難。尋找答案的過程,本質上是尋找正確問題的過程。”結構優先賈德伯格解釋道,Isomorphic Labs提出的“結構優先”方法,更注重模型的泛化能力,而非針對特定問題的專門化設計。這家新創企業正在致力於繪製人體內愈加複雜的生物星圖,從而更精準地預測任意化合物對多種疾病及其他生物過程可能產生的影響。首席技術官謝爾蓋·亞克寧指出,這旨在實現一種過去難以想像的精準度,猶如將火箭降落在人類永遠無法直接觀測的月球背面。其核心技術是一個由多個專有模型建構而成的藥物設計引擎。該引擎不僅包含升級版蛋白質預測模型,還整合了針對多肽、分子膠及抗體的專項模型。引擎的資料基礎融合了全球蛋白質資料庫、英國生物銀行、商業授權資料、內部生成資料集,以及合作夥伴提供的專有資訊。在投身藥物研發之前,馬克斯·賈德伯格曾經在DeepMind主導開發了人工智慧系統AlphaStar——這是首個在電子遊戲《星海爭霸II》中擊敗人類職業選手的人工智慧系統。圖片來源:BARRY CRASKE/COURTESY OF ISOMORPHIC亞克寧坦言,這項任務在某種程度上就是從現有資料中挖掘更深層的洞見——過去已經有許多研究者嘗試過這樣做,但大多無果而終。“然而,令人驚嘆的是,只要掌握恰當的技術,我們就能建構出這些令人震撼的系統。”他補充道。Isomorphic Labs沒有透露其短期內的主攻疾病領域——這種保密做法在製藥行業實屬常態,但在科技行業卻略顯反常。該公司稱,與禮來(Eli Lilly)、諾華等製藥巨頭達成的合作,正是其發展勢頭向好的有力佐證。(與諾華的合作已經於2025年進一步拓展。)然而在多次訪談中,多位高管表示公司的核心戰略是攻克“不可成藥”靶點。這一在藥物研發領域被廣泛使用的術語有著相對具體的含義,即針對胰腺癌、肺癌和結直腸癌中尤為常見的特定蛋白突變,以及在多種癌症中廣泛存在的轉錄因子展開研究。迄今為止,這些癌症依然對現有療法表現出較強的耐藥性,但它們很可能正是Isomorphic Labs決心突破的關鍵難題。節省五年,甚至更多藥物發現與人工智慧領域同樣遵循嚴酷的經濟規律。將一款新藥推向市場,通常需要投入超過20億美元,歷經十年乃至更長時間從發現走向臨床試驗,最終卻仍然要面對高達90%的失敗率。在人工智慧領域,算力瓶頸始終是難以迴避的挑戰;而在這一點上,背靠Alphabet的Isomorphic Labs獲得了雄厚的資金支援。Isomorphic Labs所處的賽道競爭同樣已經達到白熱化:要成為首家將人工智慧驅動藥物推向市場的新創企業,這份壓力可謂千鈞之重。其競爭對手如英矽智能目前已經有數款藥物在中國進入臨床試驗階段。Isomorphic Labs雖然沒有透露進入臨床試驗的具體時間表,但一個顯示正在接近該目標的訊號是:公司於2025年6月聘用精準腫瘤學專家本·沃爾夫擔任首席醫療官。他正在波士頓組建團隊。“要讓這一切成為現實,我需要一款具備卓越藥學特性的超級藥物,它能夠讓我直接而明確地驗證療效。”沃爾夫說道。目前,這家新創企業的人員配備與戰略方向依然主要專注於藥物發現階段,尚未擴展至臨床試驗或商業化領域。賈德伯格清楚地認識到其中的機遇與侷限。他表示:“至少在中期內,生物學中仍然會存在人類無法完全理解的部分。”他進一步指出,公司的目標是“建立科學嚴謹的流程體系,讓這一過程不再像魔術般玄奧難測,而更像是布設捕鼠器——以此精準鎖定我們想要達成的效應。”諾華的馬歇爾認為,人工智慧有望將藥物研發與臨床試驗周期縮短50%,降至五年左右。在她看來,研發時長的縮減很大程度上得益於藥物發現環節的最佳化升級。“但要進一步大幅壓縮時間難度很大,因為涉及人體生物學反應和安全性的關鍵驗證,依然需要通過臨床試驗來完成。”醫學界普遍認為,過去十年來,人工智慧藥物發現領域始終是承諾多於成效,而Isomorphic Labs如今許下的承諾則更為宏大。當我向哈薩比斯提及這一觀點時,他闡述了自己的核心理念:“攻克疾病”的願景,遠比“一勞永逸地根除病痛”更具廣度與現實可行性。他之所以刻意迴避“治癒”一詞,原因正在於此。他表示,我們固然無法保證人類不再患病,卻能夠依託先進的人工智慧與技術平台,建立一套系統化、可複製、可規模化的流程,在需求出現時,及時發現、設計並最佳化藥物或治療方案。“我們將逐步建構對生物學的基礎性認知。”哈薩比斯說道,“但願未來可以建立出類似虛擬細胞的模型,精準預測特定干預措施將引發怎樣的生物學變化。”他認為這一目標可能會在十年內實現,而這就引出下一個問題:“個性化治療能夠深入到什麼程度?不妨試想一下,你走進一家藥房,就可以為自身的特定病症做一次表型分析。如此一來,你便能夠精準掌握自身獨有的病情特徵。”這或將成為疾病治療領域的重大突破。哈薩比斯相信,對宇宙的思考,可以幫助理解存在於人體內的生物宇宙。畢竟,“isomorphic” (同構)一詞所指的,正是那些表象不同但結構相似的存在。與哈薩比斯交談後,我走向倫敦大學學院天文台那架建於1862年的弗萊望遠鏡。透過目鏡,我看到了土星。一束光從那顆行星傳到地球大約需要95分鐘。如此清晰地目睹這般遙遠的天體,讓人感到一種超現實的震撼。“宇宙的構造似乎就是為了迎接科學的探索。”哈薩比斯曾經這樣說道,“我甚至覺得,宇宙渴望被人類理解。不然科學方法何以如此奏效,又如此具有可重複性?暫且拋開人工智慧不談。電腦為何能夠正常運轉?說到底,它們不過是由沙粒、金屬和游離的電子拼湊而成的物件。可偏偏就是這些東西,催生出了不可思議的奇蹟。”(財富FORTUNE)
Google掀桌:深度研究智能體進入自動駕駛時代
OpenAI剛用Deep Research搶了先手,Google直接掀桌!DeepMind祭出研究智能體雙殺,Max版質量評分從66.1%暴拉到93.3%,知識工作自動化的軍備競賽正式進入貼身肉搏。在AI智能體上,Google這次又放出了個大招。4月末,GoogleDeepMind一口氣甩出兩款AI研究智能體。Deep Research(標準版):追求速度和低延遲,適合即時互動Deep Research Max(增強版):追求最大詳盡度,用擴展test-timecompute非同步跑後台大任務兩個智能體都基於剛發佈的Gemini 3.1 Pro。GoogleCEO Pichai也親自下場站台。Max版在三個權威基準測試中都拿到了SOTA得分:DeepSearchQA:93.3%,綜合網頁研究能力BrowseComp:85.9%,在網頁上定位難找事實Humanity's Last Exam(HLE):54.6%,人類最難學科專家級題庫這兩個智能體干的事情很直白:你給一個研究課題,它自己去網上扒資料、分析資料、生成帶圖表的完整報告。標準版處理日常研究任務,Max版專攻重度場景:盡職調查、競品分析、市場研報,那種過去要一個分析師團隊干兩天的活。Max版在DeepSearchQA基準上達到93.3%。什麼概念?去年12月同一項測試,成績是66.1%。四個月,漲了27個百分點!Humanity's Last Exam上也從46.4%拉到54.6%,直接刷新紀錄。有使用者表示日常版本的標準版即可代替日常的文獻研讀。知識工作的自動駕駛時代一個值得玩味的趨勢正在成型:AI研究工具正在從「輔助搜尋」進化成「自主研究」。過去的AI搜尋是你問一句、它答一段。現在的研究智能體是你丟一個課題,它自己跑幾十輪搜尋-分析-驗證循環,最後交一份成品報告。區別就像導航軟體和自動駕駛的距離。Google、OpenAI、Anthropic三家同時押注這個方向。Anthropic的Claude在程式碼智能體上猛攻,OpenAI用Deep Research搶佔研究場景,Google現在帶著93.3%的成績單殺回來。Pichai親自在發佈會上強調93.3%這個數字。他說這是通過增加計算資源達到的。意味著,只需花更多的電,就能得到更準的答案。計算資源成了新的入場券。小公司買不起。獨立顧問付不起。只有大企業才付得起。這不是工具升級。這是商業模式的代際替換。從「摘要機器」升級成企業工作流底座去年12月,Google通過Interactions API向開發者開放了Gemini Deep Research智能體,讓開發者能用上Google最前沿的自主研究能力。今天,Google把它推到下一個台階。Deep Research和Deep Research Max兩款智能體都由Google最強的模型Gemini 3.1 Pro驅動。Deep Research已經不再是一個聰明的「摘要機器」了。它現在是金融、生命科學、市場調研等企業級工作流的底層基礎設施。它的報告本身有獨立價值,但更重要的是——它是更複雜的AI智能體工作流的第一步:深度上下文收集。一次API呼叫,開發者就能觸發一次徹底的研究工作流——史上第一次,把公開網頁資料和你自己的專有資料流融合在一起,輸出一份專業級的、帶完整引用的分析報告。兩款智能體,匹配不同場景Google設計了兩款智能體,對應從直接面向使用者到大規模離線處理的不同需求。Deep Research(標準版)為速度和效率而生。它取代了去年12月的預覽版本,顯著降低了延遲和成本,同時把質量拉得更高。適用場景:需要低延遲的互動式使用者介面。Deep Research Max(增強版)為最大詳盡度和最高品質而生。Max利用擴展的test-timecompute(測試時計算),反覆推理、檢索、精煉最終報告。打通私有資料+原生圖表Deep Research現在可以檢索:公開網頁任意遠端MCP伺服器使用者上傳的檔案連接的檔案儲存或以上任意子集的組合。這套能力是專門為專業人士每天面對的複雜受限資料宇宙設計的。MCP協議支援(最關鍵的一項)你可以通過MCP協議,把Deep Research安全地連接到你自訂的資料和專業資料流——比如金融資料供應商、市場資料供應商。Deep Research支援任意工具定義。這讓它從一個網頁檢索器升級成了能在任意專業資料倉儲裡自主導航的智能智能體。過去分析師吃飯的傢伙(彭博、FactSet、S&PGlobal終端),現在AI可以直接接入、自主查詢、綜合分析。原生圖表與資訊圖Gemini API裡的Deep Research第一次——不再只生成文字,還原生生成高品質的圖表和資訊圖。底層實現用HTML或Nano Banana。動態可視化複雜資料集,直接嵌入分析報告中。過去一個分析師用Tableau/PowerPoint做2小時的圖表,Deep Research Max直接在報告裡原生生成。不用切換工具,不用再折騰對齊。重磅合作夥伴為了讓這項技術在低容錯率的專業領域真正落地,Google正在和金融、生命科學等行業的初創公司和企業密切合作。比如——Google正在與以下三家公司合作設計MCP伺服器:FactSet(華爾街分析師標配終端)S&PGlobal(標普全球評級與資料)PitchBook(私募股權與風險投資資料庫)讓共享客戶可以把金融資料接入Deep Research驅動的工作流,以閃電般的速度調取這些公司各自的海量資料宇宙,實現生產力的階躍式提升。延伸解讀:FactSet+S&P+PitchBook=全球投行、PE、諮詢公司研究素材的三大上游供應商。它們主動把自己的資料接入Google的AI——意味著分析師過去賴以生存的資料訂閱護城河徹底消失。過去你因為能用上這些資料而值錢,現在任何一個企業訂閱了Deep Research都能用上。如何使用即日起,Deep Research和Deep Research Max在Gemini API付費層開啟公開預覽。開發者可以訪問Google官方開發者文件,通過Interactions API開始建構。Deep Research和Deep Research Max很快也會通過GoogleCloud開放給初創公司和企業。Google做好了一個能替代分析師的AI,現在所有企業都可以用API呼叫它。 (新智元)
猛料,GoogleDeepMind公然要挖林俊暘,演都不演了
挖人如同打臉,Google殺人誅心。這兩天,網際網路行業和AI圈被同一條消息刷了屏:阿里千問大模型的核心負責人林俊暘突然發文告別。這條消息如同一塊巨石投入本就波濤洶湧的湖面。直到今天,阿里官方確認了林俊暘已離職的消息。圖源:微博作為阿里的戰略核心,千問(Qwen)團隊的人事變動,絕不僅僅是一個人的去留問題。它背後牽扯的,是一家巨頭在AI狂飆時代的技術路線選擇、組織架構調整,以及那場關於“技術策略”與“商業變現”的殘酷博弈。而更令人意外的是,就在同一天,GoogleDeepMind的相關負責人突然在社交平台上向Qwen團隊拋出了橄欖枝。那個夜晚發生了什麼?3月4日凌晨,當大多數人還在睡夢中時,阿里千問的核心負責人林俊暘在社交平台留下了一句極為克制卻又飽含情感的話:“me stepping down.bye my beloved qwen.”(我卸任了,再見了,我親愛的千問)。短短幾個詞,瞬間引爆了科技圈。圖源:X林俊暘,這個名字在業內代表著什麼?他是1993年出生的技術天才,北大碩士畢業,2019年以應屆生身份加入阿里達摩院。在短短幾年內,他一路晉陞為阿里最年輕的P10級技術負責人,親歷並主導了千問從0到1的全過程。在過去的幾年裡,林俊暘帶領團隊打了一場又一場硬仗。2023年,通義千問正式發佈;此後,團隊以令人炫目的速度推出了從0.5B到110B的系列模型,在開源社區Hugging Face上霸榜數月。正是因為他,Qwen系列成為了全球開發者心中“最能打”的中國開源模型之一,衍生模型數量突破20萬,下載量超10億次。然而,誰都沒想到,在阿里AI戰略被提升至最高優先順序、在馬雲剛剛現身談AI、在品牌剛剛統一為“千問”的節骨眼上,他竟然選擇了離開。緊隨其後的是連鎖反應。Qwen後訓練負責人郁博文、核心貢獻者李凱新等多名技術骨幹,也相繼傳出了離職的消息。GoogleDeepMind開發體驗負責人Omar Sanseviero抓住了這個機會,突然在社交平台上公開喊話:“千問的朋友們,如果想找個新地方來打造優秀模型,並為開源模型生態系統做出貢獻,請隨時聯絡我!我們的路線圖中有很多令人興奮的事情。”圖源:X這則喊話,禮貌、精準,且殺傷力極強。它不僅瞄準了剛剛失去領軍人物的Qwen團隊,更直接指向了“開源模型生態”——這恰恰是林俊暘和Qwen團隊最引以為傲的陣地。而且Omar Sanseviero本人曾是Hugging Face的開源生態負責人,江湖綽號“首席羊駝官”(Chief Llama Officer),對開源社區的運作模式熟稔於心。由他來“接客”,DeepMind顯然是做足了功課。有人說阿里的一個時代結束了。不,或許只是一個階段結束了。但在結束的廢墟上,新的獵手已經舉起了火把。為什麼在鮮花著錦之時轉身離去?對於林俊暘的離開,很多人的第一反應是“宮斗”或“內卷”。但根據多方資訊梳理,林俊暘的離開,更像是一場關於“未來怎麼走”的理念分歧,以及由此引發的權責重構。阿里內部人士透露,實際情況並沒有外界傳言的那麼狗血。隨著千問從一個小小的技術項目被提升為集團的頂層戰略,阿里認為需要招攬更多的全球技術大牛來提升“人才密度”。在這個過程中,林俊暘的權責範圍面臨調整——可能會從原先的垂直整合型負責人,變成負責其中一部分環節。這種變化,他無法接受,因而提出了辭職。簡單來說,過去林俊暘帶領的Qwen團隊更像是一個“特種部隊”:預訓練、後訓練、多模態、Infra全鏈路閉環,人少但戰鬥力極強,適合快速迭代、沖榜造勢。這是典型的“創業團隊”打法,極具理想主義色彩;而隨著集團戰略轉向,阿里希望將Qwen團隊按功能拆分成預訓練、後訓練、視覺理解等多個模組,與通義實驗室的其他團隊(如通義萬相)合併工作。這是“正規軍”的整編打法,更適合大規模協同作戰和商業化的深度落地。雖然在管理上,這種組織重構更利於資源統籌,但對於一個習慣了掌控全域的技術負責人來說,無疑是一種巨大的心理落差。圖源:微博更深層次的矛盾,或許在於“技術”與“商業化”的左右互搏。知名經濟學者盤和林對此分析得頗為透徹:“阿里需要千問快速商業化。今年AI行業有個問題,大量的基礎設施投入無法回收。但千問團隊之前的調性,是服務好使用者,做好開源。”開源,意味著免費、分享、普惠,追求的是技術影響力和社區口碑;商業化,意味著變現、收入、利潤,追求的是財務報表和市場佔有率。兩者並非天然對立,但在資源有限、競爭白熱化的當下,取捨在所難免。艾媒諮詢CEO張毅指出,阿里當前或是在“戰略收縮開源,聚焦高價值的商業閉環”。其實,在不少業內人士看來,此次事件發生的真正導火線,更有可能是新模型表現不佳。雖然Qwen3.5的小模型(如0.5B、4B等)在開發者社區好評如潮,甚至獲得了馬斯克的點贊;但在衡量大模型綜合能力的權威盲測榜單LMArena上,千問的旗艦模型Qwen3.5-397B排名並不理想,僅列第18位,與之前Qwen3-Max Preview的前三位置相去甚遠。圖源:LMArena當旗艦模型表現不及預期,當內部評價出現分歧,當組織架構的調整似乎在印證“不信任”,離開或許成為了一種必然。3月4日下午,通義實驗室緊急召開了全員大會。阿里高層反覆強調:“Qwen沒有收縮,這是一次團隊擴張。”並承認“新人引入肯定會帶來陣型變化,我們可能沒處理好”。這句話的潛台詞是:公司要長大,隊伍要整編,在這個過程中,總會有人走散。人才爭奪戰背後,AI進入“體系對抗”時代進入2026年,AI行業徒步踏進深水區,全球AI人才爭奪戰也逼近極致白熱化。領英發佈的《2026全球勞動力市場洞察報告》顯示,AI工程人才是全球流動最活躍的群體,其跨國流動的意願是普通人才的8倍。國內的資料同樣驚人,獵聘報告指出,2026年開工首周,要求會AI工具的職位同比增長超過200%。圖源:領英《2026全球勞動力市場洞察報告》在這種背景下,Google的公開喊話不僅是挖人,更是一種戰略威懾:我有最好的平台,你有最好的技術,來吧,我們一起改變世界。值得注意的是,DeepMind近期不僅招技術人才,還在公開招聘“首席經濟學家”。這說明頂級的AI實驗室已經開始思考AGI(通用人工智慧)時代的資源分配、經濟模型與社會治理問題。他們需要的不僅僅是寫程式碼的工程師,更是能夠建構未來世界規則的跨學科大腦。此舉,也代表著AI競爭開始從“單點突破”轉向“體系對抗”。正如阿里近期提出的“通雲哥”黃金三角概念——通義實驗室、阿里雲、平頭哥。未來的競爭,不再是一個模型跑分有多高,而是算力供給、模型能力與系統工程的協同作戰。林俊暘時代的Qwen,像是銳利的“矛尖”,鋒利無比,專打技術高地。而現在的阿里,需要的是“矛、盾、戰車、糧草”齊備的集團軍。從“比模型”轉向“拼體系”,用“模型+生態+AI Infra”爭奪下一代平台入口。這也是為什麼阿里會引入具有Gemini背景的周浩來接管後訓練團隊,為什麼要把團隊拆解重組。因為對於如今的阿里而言,千問App能不能在App Store榜單上穩住前三,或許比在Hugging Face上多一個星標更重要;千問眼鏡能不能通過生態協同(高德、餓了麼、支付寶)完成交易閉環,或許比在學術論文裡多一個創新點更緊迫。最後劉峰想說,這更像是技術理想主義與商業現實主義的一次正面碰撞。我們無意評判誰對誰錯。沒有林俊暘們的理想主義,就沒有Qwen今日的江湖地位;沒有商業化的反哺,AI這場耗資巨大的軍備競賽也難以持續。對於阿里而言,陣痛在所難免。但對於整個行業而言,這或許是一次必要的清醒。當潮水退去,當喧囂沉寂,最終決定勝負的,不是誰喊得最大聲,而是誰的組織更有韌性,誰的體系更能抗壓,誰能在這場漫長的馬拉松裡,跑贏最後一個彎道。3月的杭州,春寒料峭。雲谷學校的走廊裡,馬雲關於AI的講話餘音尚在;西溪園區的燈火下,新的千問團隊正在重組。再見了,林俊暘時代的Qwen。你好啊,那個必須直面商業世界所有殘酷與複雜的,全新的阿里AI。 (科技頭版)
DeepMind最新警告:大模型的道德判斷能力並不可靠
Google DeepMind 呼籲,人們應當用評估大語言模型編碼與數學能力的同等嚴格標準,審視這類模型的道德行為,包括它們在扮演陪伴者、心理諮詢師、醫療顧問等角色時的表現。隨著大語言模型不斷進步,人們開始讓它們在生活中承擔越來越多敏感的角色。智能體已經開始代替使用者執行操作。大語言模型有可能影響人類的決策過程。但目前沒有人能確定,這項技術在這類任務中的可信度究竟如何。(來源:麻省理工科技評論)我與Google DeepMind 研究科學家威廉·艾薩克(William Isaac)及其同事、同機構研究科學家朱莉婭·哈斯(Julia Haas)進行了獨家訪談,提前瞭解了他們發表在《Nature》雜誌上的研究成果。艾薩克表示,編碼和數學問題都有明確、可驗證的正確答案。道德問題則不同,這類問題通常存在多個可接受的答案。艾薩克說,道德能力十分重要,卻難以評估。哈斯補充道,在道德領域,不存在絕對的對與錯。但這並不意味著答案可以隨意給出,答案依然有優劣之分。研究人員總結了多項核心挑戰,並提出了對應的解決思路。這些思路更像是一份目標清單,而非現成的解決方案。德國薩爾大學研究大語言模型的薇拉·登伯格(Vera Demberg)表示,該研究很好地整合了不同視角。多項研究表明,大語言模型可以展現出出色的道德判斷能力。去年發表的一項研究顯示,美國民眾認為,OpenAI的GPT-4o給出的道德建議,比《紐約時報》熱門專欄《道德顧問》的人類作者更具道德性、可信度、思考深度與精準性。問題在於,人們很難區分這類表現是刻意為之,比如模仿記憶中的回答,還是模型內部確實進行了某種道德推理。簡單來說,這些表現是真正的道德立場,還是單純的道德表態。這個問題至關重要,因為多項研究同時表明,大語言模型的表現可能並不可靠。首先,模型可能會過度迎合使用者。研究發現,當使用者對模型的初始答案提出異議或反駁時,模型會立刻改變立場,給出完全相反的回答。更嚴重的是,問題的表述方式和格式變化,會導致模型給出不同答案。例如,研究人員發現,在政治價值觀相關問題上,模型在選擇題和開放式問答中會給出不同甚至完全相反的答案。登伯格及其團隊開展了一項更具說服力的實驗。他們向包括 Meta 的 Llama 3 和 Mistral 在內的多款大語言模型提出一系列道德困境,讓模型在兩個選項中選擇更合理的結果。研究人員發現,當兩個選項的標籤從“案例 1”“案例 2”改為“A”“B”後,模型經常會做出相反選擇。研究同時發現,其他細微的格式調整也會改變模型答案,比如調換選項順序、將句末問號改為冒號。總而言之,人們不能只從表面判斷大語言模型的道德表現,研究人員需要對模型進行深入測試,確認其道德表現的穩定性。哈斯表示,要讓使用者相信答案,就必須清楚答案的形成過程。哈斯、艾薩克及其Google DeepMind 同事提出,應開展新的研究方向,開發更嚴謹的方法,評估大語言模型的道德能力。這類測試可以刻意引導模型改變對道德問題的回答。如果模型輕易改變道德立場,就說明它沒有形成穩定的道德推理。另一類測試會向模型提出常見道德問題的變體,判斷模型是機械作答,還是結合實際問題給出細緻且貼合場景的回答。例如,向模型提出一個複雜場景:一名男性為兒子提供精子,幫助兒子生育後代,而模型需要分析其中的道德含義。合理的回答應關注該男性同時成為孩子生父和祖父的社會影響。即便場景與近親禁忌有表面相似之處,模型也不應得出近親相關結論。哈斯還表示,讓模型展示答案生成的步驟,可以幫助研究人員判斷答案是偶然結果,還是基於合理依據得出。思維鏈監測等技術也能發揮作用,研究人員可以通過該技術觀察部分大語言模型執行階段的內部推理過程。研究人員還可以通過機制可解釋性技術,分析模型給出特定答案的原因。該技術可以在模型執行任務時,觀察其內部運行細節。思維鏈監測和機制可解釋性技術,都無法完整呈現模型的運行過程。但Google DeepMind 團隊認為,將這些技術與多種嚴格測試結合,可以有效判斷大語言模型在關鍵或敏感任務中的可信程度。除此之外,還存在一個更廣泛的問題:Google DeepMind 等企業開發的模型服務於全球使用者,而不同使用者擁有不同的價值觀與信仰體系。以“我是否應該點豬排”這個簡單問題為例,模型的回答需要根據提問者是否為素食主義者或猶太教徒做出調整。哈斯和艾薩克坦言,這一問題目前沒有完美解決方案。但他們認為,模型設計可以採用兩種方向。一是提供多個可接受的答案,儘可能適配不同使用者;二是設定切換功能,根據使用者選擇啟用不同的道德準則。哈斯表示,現實世界十分複雜。人們可能需要結合兩種設計,因為即便在同一群體中,也會存在多種不同觀點。俄亥俄州立大學研究大語言模型與多元信仰的丹妮卡·迪利翁(Danica Dillion)沒有參與這項研究,她評價這篇論文極具價值。她表示,AI 的多元性至關重要,這也是當前大語言模型在道德推理方面的最大侷限之一。雖然模型訓練資料規模龐大,但資料仍明顯偏向西方視角。測試結果顯示,模型對西方道德觀念的理解,遠優於對非西方道德觀念的理解。登伯格認為,目前人們仍不清楚,如何建構能適配全球多元文化的道德能力模型。目前存在兩個獨立問題。一是模型應當如何運行,二是如何從技術層面實現。這兩個問題目前都沒有明確答案。在艾薩克看來,道德能力是大語言模型的全新研究方向。他表示,對 AI 發展而言,這一方向的研究價值與數學、編碼領域同等重要。提升道德能力,也有助於打造更完善、更貼合社會需求的AI系統。 (麻省理工科技評論APP)
DeepMind CEO:AI 會帶來富足,先經歷十來年洗牌
辦公室的燈剛熄,家裡的燈又亮起。一天結束,也是他真正開始的一刻。Demis Hassabis 在《財富》最新視訊採訪裡透露了他的作息:“大約晚上 10 點,我會開始第二輪工作,一直做到凌晨 4 點。”白天,他的會議一個接一個,幾乎沒有空隙;夜裡,他留出六小時,只做一件事:思考。這種作息,他已經堅持了十年。而現在的 AI 行業,讓這種節奏顯得愈發必要。他領導的 Google DeepMind,正處於一個關鍵時刻:Gemini App 月活躍使用者達到 6.5 億Search 的 AI Overview 一天觸達 20 億人最強模型 Gemini 3 在多個關鍵排行榜上名列前茅“我們進展飛快。”他的語氣很平靜,但話裡藏著整個行業的焦慮:技術越接近臨界點,洗牌的速度就越快。在這場採訪裡,Hassabis 談了競爭、泡沫、算力與人才,也推演了 AI 將如何重塑科學、醫療與未來的裝置形態。第一節|洗牌已開始:競爭在加速從競爭開始。採訪裡有一句話非常關鍵:“領先可能只保持幾個月。”這就是當下的 AI 行業。頂尖實驗室之間的差距越來越小,領先優勢隨時會被打破。1. 模型競賽:更新速度決定位置Hassabis 對 Gemini 3 的表現很滿意,但他也坦白,競爭從未像現在這樣激烈。因為所有人都在衝刺:模型更新從“一年一版”變成“幾個月一版”,新能力從單點突破變成全方位擴展,程式碼、多模態、視訊、語音同時迭代。他沒有直接說“必須加速”,但他每晚工作到凌晨 4 點的作息已經說明了一切。在這種節奏下,模型能力上慢一拍,就會被擠到第二梯隊。2. 算力緊缺:晶片成了新門檻在採訪裡,他反覆提到:需求前所未有,即使是Google的晶片也遠遠不夠。這就是整個行業正面對的最大瓶頸。想做更強的模型、想讓產品真正落地,都繞不開算力。對企業意味著什麼?預算的重點變了:從買伺服器,變成搶計算資源。大公司能提前鎖定供應,小公司要排隊等。能不能做,先看能不能跑得動。算力不夠,再好的想法也發揮不出來。這是另一個戰場:誰拿到了算力入口,誰就拿到了繼續參賽的資格。3. 人才爭奪:錢只是基礎,使命才是籌碼行業曾報導,有研究員收到 1 億美元報價,這是 AI 行業第一次出現這種數字。但 Hassabis 認為,真正能留下頂尖人才的,靠的是使命感,靠的是能產生影響的工作。錢當然重要。不過到了這個等級,人與團隊之間的吸引力更多來自:能否參與前沿研究、能否把研究變成產品被上億使用者使用、能否解決醫學材料等真正的難題。頂尖人才看重的是價值和影響力,這個標準正在改變整個行業的用人規則。對普通人來說,未來的競爭看的是你能否接近價值更高的場景,崗位名稱已經不重要了。在洗牌期,舊的崗位會消失,但對每個人核心能力的要求會更高;團隊會重組,新的機會也將大量出現。第二節|富足在成形:三條技術路徑洗牌在發生,但機會也在浮現。在訪談裡,Hassabis 給出了三個方向,已經從概念變成現實。1. 多模態助手:理解世界的新入口Hassabis 被問到什麼最讓他興奮時,答案很明確:多模態。這是他們從一開始的目標,會成為能隨身攜帶的助手。多模態的意義是什麼?讓 AI 從回答問題,變成理解環境。能看到、能聽懂、能回應真實世界。具體來說:AI 從搜尋框進入眼鏡,變成隨身裝置從被動等待指令,到主動理解你所處的場景從軟體工具,變成隨身的思考夥伴為什麼是現在?Google 十多年前就做過智能眼鏡,當時太超前,缺少殺手級應用。現在時機成熟了,AI 助手就是那個應用。Google 與 Warby Parker、Gentle Monster 的合作,就是把這種能力變成實體產品。這意味著未來工具可以替你處理更多瑣碎任務,你的時間自然能用在更有價值的事上,個人產出能力會成倍提升。效率會暴增。2. AI 藥物設計:計算替代試錯除了裝置入口,Hassabis 在醫療領域也看到了突破。他列出了一串具體進展:Isomorphic Labs 已進入多個藥物的臨床前階段與強生、禮來、諾華同時合作共有約 17 個藥物項目在推進AI 現在能在電腦裡直接設計藥物分子。傳統藥物研發從靶點找到分子,有時要 10 年以上;AI 能把這條路徑壓縮成幾個月。更重要的是,AI 能看到人類看不到的分子結構特徵和藥物設計路徑。這是一種全新的科研方式。AI 從根本上縮短了治療研發周期,人類能攻克更多疾病。3. 新材料突破:自動化科研閉環採訪接近尾聲時,Hassabis 提到:“我們會在英國建立一個自動化材料實驗室。”AI 不再只預測蛋白質,還要開始設計材料。新材料能改變什麼?電池壽命、晶片導電性能、氫能儲存、超導體、新型能源材料。這些領域的突破會帶來連鎖反應,多個產業會同步受益。自動化實驗室的作用是形成閉環:AI 設計 → 機器人合成 → 裝置測量 → 資料反饋給 AI傳統實驗一個周期可能要幾周甚至幾個月。這個閉環可以 24 小時運轉,不斷迭代最佳化,研究速度會快很多。Hassabis 在訪談裡描繪了三個未來:一個能理解世界的助手一種能把藥物研發拉回到可控範圍的能力一套能持續輸出新材料的科研生產線這三個方向,就是他所說的“富足”。前三年也許變化不明顯,但十年之後,積累的量變將引發不可逆的質變。第三節|為什麼富足之前,一定會先經歷洗牌?洗牌在發生,富足也在靠近,但為什麼是這個順序?Hassabis 給出了一個時間判斷:“最早 2030 年,可能有 50% 的機會到達 AGI。”也就是說,富足還要等幾年。但是技術在快速進化,市場需求在爆發,所有人都想搶佔位置,資源卻有限。在 AGI 到來之前會發生什麼?1. 技術臨界點將近,但不會立刻實現從現在到 AGI,大約還有 4-8 年。Hassabis 的預測比較保守:不會有突然的飛躍。短期內 AI 不會一下子替代所有工作,但每年都有新變化。某個崗位的工作內容變了,某個產品要重新設計,某個團隊發現原來的流程不適用了。單看每一年變化不大,但幾年下來差距就拉開了。這個過程就是洗牌。有些公司會站穩腳跟,有些會被淘汰出局。2. 泡沫並存:整體估值合理,但個別項目過熱關於泡沫,Hassabis 的判斷很犀利:AI 行業的整體需求是真實的,但部分早期項目的估值確實偏高。為什麼會出現這種割裂?因為兩個趨勢在同時發生。一方面,模型呼叫量、使用者規模、企業採購都在激增,市場確實有真實需求。另一方面,大量尚未完成技術驗證的早期公司,僅僅因為踩中了概念就拿到了千萬美元融資。資本急於搶佔入口,往往會導致定價失效。結果是:行業整體在增長,但估值虛高的項目會出局。活下來的是那些能證明商業價值的團隊。錢會跟著價值走。3. 路線分化:應用快速見錢,前沿決定格局訪談裡,Hassabis 提到中國團隊更專注應用落地,西方團隊更專注前沿突破。應用路徑:現金流快、場景清晰、容易規模化。前沿路徑:技術壁壘高、回報周期長,一旦成功,能重塑行業。兩條路徑各有價值。做應用可以先活下來,但長期競爭力還是看前沿突破。只走一條路都有風險:只做應用的公司,可能在技術上被甩開;只做研究的團隊,可能燒完錢還沒找到商業化路徑。真正能穿越周期的團隊,既要快速落地,也要有技術積累。未來十年,拼的不是數量,是精準度。技術突破可能就是幾年的事。資本的耐心也在變,更關注你能不能驗證出來,不只是聽你講概念。對個人來說,機會藏在新技術、新科學、新材料裡,能不能抓住才是關鍵。技術路線的選擇,決定了誰能走到最後。富足會來,但不是平均分配到每個人。在那之前,這場持續數年的洗牌,會先完成對整個行業的殘酷篩選。結語|洗牌在眼前,富足在前方採訪結束前,Hassabis 說:“我希望還能有時間認真思考。”越接近富足,越需要冷靜。過去兩三年,模型迭代在加速,應用落地的速度也在加快,資本在重新押注。行業看起來很熱鬧,但底層邏輯在改變:晶片成了瓶頸,AI 在推動科學進展,虛高的估值在調整。拐點就在當下。未來不會一夜到來,但路徑會越來越清晰。 (AI 深度研究員)